Une optimisation de l'extraction d'un jeu de règles s'appuyant sur les caractéristiques statistiques des données
Identifieur interne : 007348 ( Main/Exploration ); précédent : 007347; suivant : 007349Une optimisation de l'extraction d'un jeu de règles s'appuyant sur les caractéristiques statistiques des données
Auteurs : Martine Cadot ; Amedeo NapoliSource :
- Extraction des connaissances et apprentissage - Méthodes d'optimisation pour l'ECA, RSTI série RIA-ECA ; 2003.
English descriptors
- KwdEn :
Abstract
Cet article présente un essai d'optimisation du jeu de règles extrait par la technique des motifs fréquents. Partant d'un tableau de données tiré d'un corpus de résumés d'articles scientifiques dans le domaine de la biologie moléculaire, on utilise les techniques usuelles d'extraction de règles d'association pour construire le jeu de règles associé aux données. On définit ensuite des règles « fortuites » par des techniques de simulation. On discute alors du choix de celles qu'il convient de supprimer afin d'optimiser le jeu de règles de départ. Les indices associés à des régles extraites de données s'appuient généralement sur le support et la confiance. On mentionne dans l'article les résultats obtenus avec d'autres indices de qualité des règles utilisés actuellement en fouille de données. Enfin, on se réfère aux propriétés statistiques des données afin de préparer la voie à une optimisation des jeux de règles extraits de bases de données variées, ce qui donne des pistes de prolongement à ce travail.
Affiliations:
Links toward previous steps (curation, corpus...)
- to stream Crin, to step Corpus: 003C03
- to stream Crin, to step Curation: 003C03
- to stream Crin, to step Checkpoint: 000912
- to stream Main, to step Merge: 007748
- to stream Main, to step Curation: 007348
Le document en format XML
<record><TEI><teiHeader><fileDesc><titleStmt><title xml:lang="fr" wicri:score="-308">Une optimisation de l'extraction d'un jeu de règles s'appuyant sur les caractéristiques statistiques des données</title>
</titleStmt>
<publicationStmt><idno type="RBID">CRIN:cadot03c</idno>
<date when="2003" year="2003">2003</date>
<idno type="wicri:Area/Crin/Corpus">003C03</idno>
<idno type="wicri:Area/Crin/Curation">003C03</idno>
<idno type="wicri:explorRef" wicri:stream="Crin" wicri:step="Curation">003C03</idno>
<idno type="wicri:Area/Crin/Checkpoint">000912</idno>
<idno type="wicri:explorRef" wicri:stream="Crin" wicri:step="Checkpoint">000912</idno>
<idno type="wicri:Area/Main/Merge">007748</idno>
<idno type="wicri:Area/Main/Curation">007348</idno>
<idno type="wicri:Area/Main/Exploration">007348</idno>
</publicationStmt>
<sourceDesc><biblStruct><analytic><title xml:lang="fr">Une optimisation de l'extraction d'un jeu de règles s'appuyant sur les caractéristiques statistiques des données</title>
<author><name sortKey="Cadot, Martine" sort="Cadot, Martine" uniqKey="Cadot M" first="Martine" last="Cadot">Martine Cadot</name>
</author>
<author><name sortKey="Napoli, Amedeo" sort="Napoli, Amedeo" uniqKey="Napoli A" first="Amedeo" last="Napoli">Amedeo Napoli</name>
</author>
</analytic>
<series><title level="j">Extraction des connaissances et apprentissage - Méthodes d'optimisation pour l'ECA, RSTI série RIA-ECA</title>
<imprint><date when="2003" type="published">2003</date>
</imprint>
</series>
</biblStruct>
</sourceDesc>
</fileDesc>
<profileDesc><textClass><keywords scheme="KwdEn" xml:lang="en"><term>association rule extraction</term>
<term>data mining</term>
<term>frequent itemset level-wise search</term>
<term>pruning optimization.</term>
<term>quality criteria</term>
<term>rule set pruning</term>
<term>threshold</term>
<term>zipf distribution</term>
</keywords>
</textClass>
</profileDesc>
</teiHeader>
<front><div type="abstract" xml:lang="fr" wicri:score="-3364">Cet article présente un essai d'optimisation du jeu de règles extrait par la technique des motifs fréquents. Partant d'un tableau de données tiré d'un corpus de résumés d'articles scientifiques dans le domaine de la biologie moléculaire, on utilise les techniques usuelles d'extraction de règles d'association pour construire le jeu de règles associé aux données. On définit ensuite des règles « fortuites » par des techniques de simulation. On discute alors du choix de celles qu'il convient de supprimer afin d'optimiser le jeu de règles de départ. Les indices associés à des régles extraites de données s'appuient généralement sur le support et la confiance. On mentionne dans l'article les résultats obtenus avec d'autres indices de qualité des règles utilisés actuellement en fouille de données. Enfin, on se réfère aux propriétés statistiques des données afin de préparer la voie à une optimisation des jeux de règles extraits de bases de données variées, ce qui donne des pistes de prolongement à ce travail.</div>
</front>
</TEI>
<affiliations><list></list>
<tree><noCountry><name sortKey="Cadot, Martine" sort="Cadot, Martine" uniqKey="Cadot M" first="Martine" last="Cadot">Martine Cadot</name>
<name sortKey="Napoli, Amedeo" sort="Napoli, Amedeo" uniqKey="Napoli A" first="Amedeo" last="Napoli">Amedeo Napoli</name>
</noCountry>
</tree>
</affiliations>
</record>
Pour manipuler ce document sous Unix (Dilib)
EXPLOR_STEP=$WICRI_ROOT/Wicri/Lorraine/explor/InforLorV4/Data/Main/Exploration
HfdSelect -h $EXPLOR_STEP/biblio.hfd -nk 007348 | SxmlIndent | more
Ou
HfdSelect -h $EXPLOR_AREA/Data/Main/Exploration/biblio.hfd -nk 007348 | SxmlIndent | more
Pour mettre un lien sur cette page dans le réseau Wicri
{{Explor lien |wiki= Wicri/Lorraine |area= InforLorV4 |flux= Main |étape= Exploration |type= RBID |clé= CRIN:cadot03c |texte= Une optimisation de l'extraction d'un jeu de règles s'appuyant sur les caractéristiques statistiques des données }}
This area was generated with Dilib version V0.6.33. |